import pandas as pd

# 创建示例数据
data = {
    '姓名': ['张三', '李四', '王五', '赵六', '钱七', '孙八', '周九', '吴十'],
    '部门': ['技术', '销售', '技术', '人事', '销售', '技术', '人事', '销售'],
    '年龄': [25, 30, 35, 28, 32, 29, 27, 31],
    '薪资': [8000, 12000, 15000, 10000, 11000, 13000, 9000, 11500]
}

df = pd.DataFrame(data)
print("员工数据:")
print(df)

# 按部门分组
grouped = df.groupby('部门')
print("\n按部门分组:")

print("\n按部门分组的平均薪资:")
print(grouped['薪资'].mean())

# 按照部门分组的统计信息
print("\n按部门分组的统计信息:")
print(grouped['薪资'].agg(['mean', 'min', 'max','count']))

# 多列分组
df['绩效'] = ['A','B','A','C','B','A','C','B']
grouped_multi = df.groupby(['部门', '绩效'])
print("\n 按照部门和绩效分组:")
print(grouped_multi['薪资'].mean())

# 应用自定义函数
def salary_range(x):
    return x.max() - x.min()
print("\n 各部门薪资范围:")
print(grouped['薪资'].apply(salary_range))